22 research outputs found

    Klasifikasi Untuk Prediksi Cuaca Menggunakan Esemble Learning

    Get PDF
    Mengetahui cuaca hal yang sangat penting untuk kehidupan manusia, yang dinyatakan dengan parameter seperti suhu, kecepatan angin, tekanan udara, curah hujan, yang menjadi komponen utama untuk cuaca. Tujuan mengetahui cuaca adalah terutama bagi masyarakat pedesaan yang bergerak dibidang pertanian, perkebunan dan lain lain. Karena itu untuk penentuan cuaca, mendapatkan informasi cuaca perlu dibuat sehingga dapat dimanfaatkan oleh masyarakat. Permasalahan yang muncul bagaimana membuat prediksi cuaca akurat dan otomatis sehingga dapat dilakukan oleh setiap orang. Dalam penelitian ini mengajukan esemble learning untuk menghitung peluang dari masing-masing atribut kelompok yang ada dan menentukan pedekatan mana yang paling optimal, artinya pengelompokan dapat dilakukan berdasarkan kategori yang pengguna masukkan pada aplikasi. Esemble learning melibatkan beberapa algoritme untuk mencari nilai rata rata akurasi. Hasil yang diharapkan bisa menjadi rujukan untuk membangun aplikasi perakiraan cuaca.hasil akurasi adalah 81.21% dan MSE 18.79%

    PERBANDINGAN PEMBOBOTAN KATA DALAM SISTEM TEMU BALIK INFORMASI

    Get PDF
    ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian informasi yang relevan terhadap kebutuhan pengguna, yang diekspresikan dalam query, menjadi input bagi IR system dan selanjutnya diproses oleh system kemudian ditampilkan dokumen yang relevan dengan query tersebut. Salah satu metode pencarian informasi yang relevan dengan query adalah dengan pembobotan kata baik query maupun dokumen. Metode yang sering digunakan adalah pembobotan kata lokal dan pembobotan global, adapun pembobotan kata lokal yang digunakan tf, logaritmic tf, binary tf dan augmented tf dan pembobotan globalnya adalah idf, idfp, idfb. Dalam penelitian ini selain membandingkan algoritma pembobotan kata. Tingkat keberhasilan algoritma di ukur berdasarkan precision, recall dan niap. Penelitian ini setelah dilakukan perbandingan dan analisis hasil algoritma pembobotan, hasil algortima yang baru lebih baik daripada yang lama. Kedepan perlu dilakukan dikombinasikan pembobotan dengan algoritma semantic sehingga mendapatkan hasil yang lebih baik. Kata kunci : Sistem temu balik informasi, pembobotan, pembobotan kata lokal, pembobotan global, similarity ( kemiripan), vector space model

    PENERAPAN ALGORTIMA RANDOM FOREST UNTUK KLASIFIKASI KAB KOTA PROVINSI JAWA BARAT BERDASARKAN PENDAPATAN SEKTOR PERTANIAN

    Get PDF
    Kesejahteraan masyarakat pedesaan yang ada Provinsi Jawa Barat, yang jauh dari perkotaan, tidak lepasdari pendapatan utamanya adalah di sektor pertanian. Sektor pertanian meliputi beberapa sektor,kondisinya masih banyak ditemukan dibawah garis kemiskinan. Karena fasilitas dan pembiayaan masihminim dari pemerintah setempat. Mengingat akar permasalahannya adalah hampir semua desa yang adadi kab kota tidak mempunyai data yang benar, akurat dan tepat tentang kondisi permasalahan danpotensi desa yang dimiliki. Dengan penelitian ini dapat diharapkan salah satu cara untuk menganalisadata pendapatan dari sektor pertanian, baik potensi yang dimiliki, agar dapat lebih baik dalampengambilan keputusan. Dan teknik pengolahan data ini bisa diimplemetasikan bagi pemerintahsetempat untuk mengukur tingkat keberhasilan pertaniannya. Untuk seleksi fitur dalam penelitian iniadalah menggunakan algoritma Random Forest untuk mengklasifikasikan data secara otomatis denganhasil akhir keberhasilan algoritmanya di peroleh tingkat akurasi 87,50 %.Kata kunci: Datamining, Klasifikasi, Random forest, Pertania

    MENGUKUR TINGKAT KEPUASAN MAHASISWA DALAM PEMBELAJARAN DENGAN NAÏVE BAYES

    Get PDF
    Mengukur kepuasan pembelajaran adalah hak mutlak bagi mahasiswa sehinggakampus wajib memperbaiki layanan baik kwalitas dan sarana dan prasarana. Karenakeberhasilan suatu institusi adalah di ukur dari tingkat kepuasan. Sering jadi kendalaadalah bagaimana mengukur kepuasan pelanggan dengan data teks berbentuk tidaktersetruktur. Sehingga konsumen kesulitan mendapatkan hasil yang baik. Mahasiswamemiliki sentiment yang berbeda beda terhadap baik pelayanan, proses pembelajarandan sarana prasaran. Untuk mempermudah mengukur kepuasan pelanggan. Penelitianini menerapkan teknik analisis sentimen untuk menilai kecenderungan saran terkaitdengan berbagai faktor yang berkontribusi pada keberhasilan proses pembelajaranseperti metode pengajaran, suasana akademik, fasilitas dan ruang kelas, laboratorium,perpustakaan dan fasilitas kampus lainnya. Metode yang digunakan penelitian iniadalah algoritma Naive Bayes. Dalam penelitian ini mendapatkan akurasi 86,9

    Optimized Machine Learning Performance with Feature Selection for Breast Cancer Disease Classification

    Get PDF
    The prevalence of breast cancer is relatively high among adults worldwide. Particularly in Indonesia, according to the latest data from the World Health Organization (WHO), breast cancer accounts for 1.41% of all deaths and continues to increase. In order to address this growing issue, a proactive approach becomes essential. Therefore, the objective of this study is to classify the diagnosis of breast cancer into two categories: Benign and Malignant. Moreover, this classification pattern can serve as a benchmark for early detection and is expected to reduce mortality and cancer rates in breast cancer cases. The dataset used in this study is obtained from Kaggle and consists of 569 rows with 32 attributes. Various machine learning algorithms, such as Artificial Neural Network (ANN), Support Vector Machine (SVM), Decision Tree (DT), Random Forest (RF), Logistic Regression (LR), K-Nearest Neighbors (KNN), and Naïve Bayes (NB), are employed for the classification analysis in this disease. . This study uses Principal Component Analysis (PCA) for optimized feature selection techniques with dimension reduction are employed on the dataset prior to modeling the data. Our highest accuracy model is the Support Vector Machine (SVM) with an RBF kernel, utilizing c-value selection. Additionally, the Logistic Regression (LR) model achieves an accuracy of 97.3%. However, it is worth noting that the precision and recall of the SVM model are both 100%. Moreover, the Receiver Operating Characteristic (ROC) curve indicates that the SVM graph surpasses the LR graph, which can be attributed to the results obtained from the confusion matrix calculation, where the False Positive Rate is found to be 0. Consequently, the overall performance evaluation of the SVM model with an RBF kernel, along with the utilization of the c-value selection approach, is significantly superior. This is primarily due to the fact that the SVM model does not make any incorrect predictions by classifying something as positive when it is actually negative

    Aplikasi Linier Regresi dengan Algoritma Jaringan Syaraf Tiruan untuk Sentimen Analisis

    Get PDF
    Penggunaan media sosial seperti twitter adalah salah satu yang popular di masyarakat Indonesia dengan kemudahan dapat diakses oleh siapapun selama ia mempunyai alat pendukung dan koneksi internet, sekarang ini orang bisa ngetweet dari mana dan kapan saja melalui gadgetnya, Karena begitu mudahnya diakses semua orang dari berbagai kalangan dan latar belakang bisa berkomentar atau membuat status untuk mengomentari suatu produk, kejadian, ataupun tokoh. Dengan banyaknya isi kicauan atau tweet yang berhubungan dengan seorang tokoh, khususnya Pemilihan calon pemimpin Presiden, Pilkada yang ada di Indonesia. Isi tweet atau kicauan setiap orang pastinya berbeda – beda tetapi muatannya hanya dibatasi oleh tiga sentiment Posistif, Negatif dan Netral. Dengan adanya keputusan sentiment analisis dapat mencari isi kampanye yang sehat, mana yang negatif dan kampanye hitam. karakter untuk seleksi fitur menggunakan algoritma Neural Network (Jaringan syaraf tiruan) untuk mengklasifikasi sentimen secara otomatis, performance hasil yang didapatkan 53.33%

    Implementasi Algoritma Neural Network untuk Mendukung Keputusan di Desa Tamanmekar

    Get PDF
    Tingkat kesejahteraan masyarakat pedesaan yang terutama jauh dari perkotaan, masih banyak ditemukan dibawah garis kemiskinan. Mengingat akar permasalahannya adalah hampir semua desa tidak mempunyai data yang benar, akurat dan tepat tentang kondisi permasalahan dan potensi desa yang dimiliki. Padahal pemerintah pusat menyalurkan anggaran tiap tahun untuk setiap desa, hampir mencapai 1 milyar pertahun. Dengan tidak memiliki data yang akurat dan benar, sehingga pembangunan tidak tepat sasaran termasuk penyaluran beras rakyat miskin (Raskin), Bantuan langsung tunai (BLT). Masih ditemukan penyaluran yang tidak tepat sasaran, sesuai dengan yang rencanakan oleh pemerintah. Dengan penelitian ini diharapkan salah cara untuk menganalisa data penduduk, baik  permasalahan dan potensi yang dimiliki. Sehingga penyaluran bantuan lainya tepat sasaran. Metode pengolahan data, untuk diimplementasikan agar desa memiliki data yang benar dan akurat. Untuk seleksi fitur dalam penelitian ini menggunakan algoritma Neural Network (Jaringan syaraf tiruan), hasil accuracy algoritma penelitian ini adalah 94.96 %. Sehingga dapat digunakan sebagai referensi untuk mengolah data untuk Bantuan dari pemerintah

    Classification Data for Direct Marketing using Deep Learning

    Get PDF
    One of the tasks of banking marketing is to analyze customers' data and to find out the potential customers to save deposits. Generally, the method used to analyze customer data is by classifying all customers who have taken the time deposit into the target marketing, so this method causes the high cost of marketing operations. Therefore, this research is conducted to help solve the problem by designing a data mining application that can serve to classify the criteria of customers who potentially to save deposits in the bank. In classifying customer data has been done a lot by researchers before with various algorithms, now researchers use deep learning to classify the target in want by the banking. The results showed that achieved using deep learning accuracy is = 80%, MSE = 0.0943, AUC = 0.8533. The results of this study can be reference to build an application that can facilitate the banking in obtaining its target marketing in the future

    Implementasi Algoritma K-Means terhadap Pengelompokan Nilai Ujian Nasional Tingkat SMP di Provinsi Jawa Barat

    Get PDF
    Peraturan Pemerintah Republik Indonesia Nomor 13 Tahun 2015 Pasal 66 menjelaskan bahwa Ujian Nasional (UN) sangatlah penting karena menjadi suatu pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu pada Sekolah Dasar (SD), Sekolah Menengah Pertama (SMP) dan Sekolah Menengah Atas (SMA). Berdasarkan data yang ditemukan pada website Kementrian Pendidikan dan Kebudayaan yaitu nilai rata-rata UN SMP, SMA dan SMK data yang disajikan tidak berdasarkan peringkat atau kategori tertentu sehingga informasi yang didapatkan menjadi kurang jelas. Dari permasalahan tersebut dilakukan sebuah penelitian untuk menambang data menjadi informasi, pada penelitian ini data yang digunakan adalah nilai rata-rata UN tingkat SMP di Provinsi Jawa Barat menggunakan teknik data mining . Penelitian dilakukan dengan cara perhitungan manual menggunakan Microsoft Excel Kemudian dievaluasi menggunakan tools Rapidminer 9.2.0. Penelitian ini menghasilkan Cluster Baik 10 Kabupaten/Kota, Cluster Cukup Baik 15 Kabupaten/Kota dan Cluster Kurang Baik 2 Kabupaten/Kota 2. Mata Pelajaran Matematika dan IPA saat ini tidak menentukan kategori, karena nilai yang didapat rata-rata lebih kecil dari Bahasa Inggris dan Bahasa Indonesia sehingga bagi Pemerintah Dinas Pendidikan untuk perlu meningkatkan lagi dalam proses pembelajaran di Provinsi Jawa Barat

    PERBANDINGAN HASIL PREDIKSI KREDIT MACET PADA KOPERASI MENGGUNAKAN ALGORITMA KNN DAN C5.0

    Get PDF
    Koperasi memberikan jasa simpan pinjam dana untuk meningkatkan ekonomi masyarakat, seperti mengembangkan usaha, dan memenuhi kebutuhan hidup sehari-hari. Dalam proses simpan pinjam dana pasti ada permasalahan-permasalahan yang sering terjadi, seperti nasabah terlambat membayar cicilan dana, dan nasabah gagal dalam mengembangkan usahanya, sehingga menyebabkan kredit macet. Pada penelitian ini akan dilakukan prediksi kredit macet untuk meminimalisir terjadinya kredit macet dengan cara memperhatikan data yang dimasukan nasabah untuk proses peminjaman dana. Metode yang digunakan dalam penelitian ini yaitu dengan menerapkan algortima K-Nearest Neighbor dan algoritma C5.0. Hasil akurasi dari algoritma C5.0 mendapatkan nilai yang lebih baik dari algoritma K-Nearest Neighbor yaitu 86,67%. Sehingga algoritma C5.0 lebih efektif untuk memprediksi kredit macet
    corecore